以字串特徵做為文本資料之錯誤偵測 (Textual Data Error Detection based on String Features) [In Chinese]
نویسندگان
چکیده
منابع مشابه
應用句型結構與部份樣本樹於對話行為之偵測 (Dialogue Act Detection Using Sentence Structure and Partial Pattern Trees) [In Chinese]
本論文提出一使用部份樣本樹及句型結構於對話行為之偵測。為了建構具強健性的對話 行為偵測模型,我們針對語音辨識之輸出語句,使用部份樣本樹來產生多重候選句,以 避免語音辨識錯誤所衍生句子錯誤之問題。而後再經由剖析器得到候選句所對應之語法 規則。而再針對每一類對話行為所包含的規則做句型分類,來降低對話行為之間的混淆。 最後,利用潛在對話行為矩陣來描述語法規則和意圖之間的關係。另外,在對話系統應 用中,我們採用部份觀察馬可夫決策程序從對話歷程中訓練出之最佳對話策略,以增進 對話系統的可用性。在實驗中,我們建立一個旅遊資訊諮詢對話系統,作為實際應用測 試平台。而在測試時,分別就每項對話行為做測試。相較於應用語義表格(semantic slot) 方法達到之 48.1%正確率,本論文所提之方法可得到整體正確率為 81.9%,提升了 33.8% 的正確率。由實驗可知論文所提之方法在實際應用上能有明...
متن کامل基於卷積類神經網路之廣播節目音訊事件偵測系統 (Automatic Audio Event Detection of Broadcast Radio Programs Based on Convolution Neural Networks) [In Chinese]
廣播電臺節目中通常包含語音,音樂與其他音訊事件(如笑聲或特效聲)。若能偵 測並切割這些音訊事件,就能進一步對廣播節目進行加值運用。例如,轉寫語音片段的 逐字稿,或是辨認音樂片段的歌名與曲名,以利檢索。針對此問題,在本論文中,我們 首先設計,並以人工標註出一廣播節目音訊事件資料庫,再利用 Convolutional Neural Network (CNN)自動擷取有效的特徵音訊參數,對廣播電臺的音檔做音訊事件偵測與切 割,最後轉成具時間資訊的音訊事件標註檔。實驗方面我們從教育電臺節目中,選出新 聞類與不同性質的談話類節目共 14 個,經人工標注後,獲得總長度共約 60 小時的音 檔,並用來訓練與測試 CNN和傳統 Gaussian Mixture Model(GMM)的效能。實驗結 果顯示以 CNN直接搭配頻譜參數,在偵測語音與非語音,音樂與非音樂或其它與非其 它音訊事件等的錯誤率(e...
متن کاملDetecting Word Ordering Errors in Chinese Sentences for Learning Chinese as a Foreign Language
Automatic detection of sentence errors is an important NLP task and is valuable to assist foreign language learners. In this paper, we investigate the problem of word ordering errors in Chinese sentences and propose classifiers to detect this type of errors. Word n-gram features in Google Chinese Web 5-gram corpus and ClueWeb09 corpus, and POS features in the Chinese POStagged ClueWeb09 corpus ...
متن کامل基於深層類神經網路之音訊事件偵測系統(Deep Neural Networks for Audio Event Detection)[In Chinese]
現實生活中常有許多聲音事件會一起發生,而聲音會重疊在一起,使得傳統(Gaussian Mixture Model ,GMM)方法很難準確辨認這些重疊的聲音事件。因此,本文提出以深層 類神經網絡(Deep Neural Network, DNN)來檢測這些互相干擾的聲音事件,並據此參加 Detection and Classification of Acoustic Scenes and Events 2016 (DCASE2016) 比賽, DCASE2016 評比提供的音訊資料,內有兩種場景,包括居家與戶外,共有 18 種含有背 景的聲音事件。實驗結果顯示使用 DNN 與傳統 GMM 比較,其場景偵測錯誤率可從 0.91 降至 0.86、F1 分數並從 23.4%提升到 26.8%。此外針對室內環境的音訊事件偵測,錯誤 率可從 1.06 降至 0.86,F1 分數並從 8.9%提升...
متن کامل強健性語音辨識中分頻段調變頻譜補償之研究 (A Study of Sub-band Modulation Spectrum Compensation for Robust Speech Recognition) [In Chinese]
雖然語音科技進步迅速,但自動語音辨識仍是一門值得繼續研究開發的課題。因為 目前多數的語音辨識系統應用於不受干擾的安靜環境,雖然能得到相當滿意的辨識效 果,但若將其應用於實際的環境中,語音訊號往往會因為環境雜訊的影響,導致辨識效 能有明顯地衰減,發展多年的強健性技術即是針對此項缺點作改進。 在諸多強健性技術中,有一類方法為對語音特徵作統計上的正規化,傳統上, 這些方法都是對全頻段的語音特徵時間序列做正規化處理,然而,在分析此類方法的效 能上,通常是以其調變頻譜的正規化程度作為效能的依據,因此,如果直接在語音特徵 之調變頻譜上作正規化,應亦可達到不錯的效果。另外,由於不同頻率的調變頻率成 份具有不相等的重要性,但是傳統之特徵時間序列正規化法相對忽略了此性質,基於這 些觀察,在本論文中,我們提出了一系列的分頻段調變頻譜統計正規化法,此類方法可 以分別正規化不同頻段的統計特性,進而提升語音特...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2006